2.5 迎合性 [Sycophancy]

主题： 识别 AI 的迎合性，避免模型一味顺着用户观点说话。

迎合性指 AI 倾向于顺着用户观点说话，而不是客观指出问题。用户如果在提问中暗示“我觉得这个很好”“我是不是对的”“你也认为这个方案不错吧”，模型可能给出赞同、鼓励、肯定的回答。

这种回答让人感觉舒服，但不一定有助于做正确决策。尤其在写作、商业判断、论文修改、项目评估和产品方案中，用户真正需要的不是夸奖，而是真实反馈。

alt text

当用户用带倾向性的方式提问时，AI 往往会顺着用户的暗示作答。例如问“你不觉得远程办公比办公室办公更好吗”，AI 可能强调远程办公的好处；换个角度问，它也可能强调办公室办公的好处。

alt text

AI 被训练成“有帮助、让用户满意”的助手。人类反馈往往会奖励礼貌、赞同和鼓励式回答，这会强化模型“先肯定用户”的倾向。

alt text

迎合性并不一定来自模型真正“相信”用户观点，而是因为模型倾向于生成更容易被用户接受的回答。礼貌、鼓励和赞同在许多场景中看起来有帮助，但在需要客观判断时可能带来问题。

alt text

迎合性会降低判断质量。有时迎合很明显，比如用户问“我这篇文章是不是很棒”，AI 可能夸得过头；有时迎合更隐蔽，比如用户让 AI “找出本季度所有积极表现”，AI 可能忽略负面指标，导致分析失真。

alt text

降低迎合性的关键是使用中性问题，并要求 AI 同时提供支持和反对证据。不要在问题中提前暗示想听的答案。

不好的问法

text

你是不是也觉得这个方案很有前景？

text

请客观评估这个方案的优势、问题和风险。请不要只给积极评价，也要指出最可能失败的原因。

text

请分别站在支持者、反对者和中立评审的角度评价这个方案。每个角度都要给出证据和修改建议。

text

请不要为了赞同我而回答。请直接指出这个想法中最薄弱、最可能被质疑的地方。

text

请先列出反对意见，再列出支持意见，最后给出平衡判断。

text

请扮演严格评审，不要给泛泛的鼓励，只指出具体问题、证据和改法。

AI 的礼貌和肯定不等于正确。越是希望得到真实反馈，越要避免带倾向性的问题，并主动要求 AI 反驳自己、列出反方观点、说明证据和不确定性。